第 12 屆 iThome 鐵人賽

DAY 6

1

自我挑戰組

資訊爆炸時代學資訊檢索與擷取系列第 7 篇

Day07:語言模型(Language Models)

12th鐵人賽

2020-09-08 00:44:26

3015 瀏覽

分享至

語言模型(Language Models)在1998年才被應用到IR上。Language Models主要目的在於判斷長度T的文字序列在自然語言中出現的可能性。其中，Language Models可以表示成給定一段文字序列預測下一個文字出現的機率。

其中，Language Models最有名的是N-gram語言模型，可以分成:

Unigram
每個字的出現都和前個字無關，表示如下:
Bigram

語言模型(Language Models)應用於IR上主要有兩種方法:

KL-Divergence Measure
Query-Likelihood Measure

今天我先介紹KL-Divergence Measure

KL-Divergence Measure

KL-Divergence Measure主要拿來計算query LM 和 document LM之間的距離

KL-Divergence Measure可以簡化為QLM

Day06:最佳匹配模型(Best Match Model)

Day08: Query Likelihood Measure

系列文

資訊爆炸時代學資訊檢索與擷取共 8 篇

目錄

RSS系列文訂閱系列文

6 人訂閱

完整目錄

熱門推薦

{{ item.subject }}

{{ item.channelVendor }} | {{ item.webinarstarted }} |

{{ formatDate(item.duration) }}

直播中

尚未有邦友留言

立即登入留言

參賽組數

902 組

團體組數

37 組

累計文章數

19855 篇

完賽人數

528 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

IT邦幫忙